智能论文笔记

Online Trading Models with Deep Reinforcement Learning in the Forex Market Considering Transaction Costs

Koya Ishikawa , Kazuhide Nakata

分类：人工智能 | 机器学习

2021-06-06

近年来，使用人工智能创造了广泛的投资模式。人工智能自动交易可以扩大交易方式的范围，例如通过授权每天24小时运行的能力以及以高频交易的能力。如果可以充分考虑过去的数据，也可以预期自动交易比使用更多信息交易。在本文中，我们提出了一种基于深度加强学习模型的投资代理，这是一个人工智能模型。该模型考虑了实际交易中涉及的交易成本，并在很长一段时间内创建交易的框架，以便它可以在单一贸易上进行大量利润。在这样做时，它可以最大限度地提高利润，同时保持交易成本低。此外，考虑到实际操作，我们使用在线学习，以便系统可以通过不断更新最新的在线数据而不是使用静态数据来继续学习。这使得可以通过始终纳入当前的市场趋势信息来贸易非静止金融市场。

translated by 谷歌翻译

P2Net: A Post-Processing Network for Refining Semantic Segmentation of LiDAR Point Cloud based on Consistency of Consecutive Frames

Yutaka Momma , Weimin Wang , Edgar Simo-Serra , Satoshi Iizuka , Ryosuke Nakamura , Hiroshi Ishikawa

分类：计算机视觉 | 机器人

2022-12-01

We present a lightweight post-processing method to refine the semantic segmentation results of point cloud sequences. Most existing methods usually segment frame by frame and encounter the inherent ambiguity of the problem: based on a measurement in a single frame, labels are sometimes difficult to predict even for humans. To remedy this problem, we propose to explicitly train a network to refine these results predicted by an existing segmentation method. The network, which we call the P2Net, learns the consistency constraints between coincident points from consecutive frames after registration. We evaluate the proposed post-processing method both qualitatively and quantitatively on the SemanticKITTI dataset that consists of real outdoor scenes. The effectiveness of the proposed method is validated by comparing the results predicted by two representative networks with and without the refinement by the post-processing network. Specifically, qualitative visualization validates the key idea that labels of the points that are difficult to predict can be corrected with P2Net. Quantitatively, overall mIoU is improved from 10.5% to 11.7% for PointNet [1] and from 10.8% to 15.9% for PointNet++ [2].

translated by 谷歌翻译

Dynamic collaborative filtering Thompson Sampling for cross-domain advertisements recommendation

Shion Ishikawa , Young-joo Chung , Yu Hirate

分类：人工智能

2022-08-25

最近，在线广告客户使用推荐系统（RSS）来显示广告来改善用户的参与度。上下文强盗模型是一种广泛使用的RS，可利用和探索用户的参与度并最大化长期奖励，例如点击或转换。但是，当前的模型旨在仅在特定域中优化一组广告，并且不与多个域中的其他模型共享信息。在本文中，我们提出了动态协作过滤汤普森采样（DCTS），这是新颖而简单的模型，以在多个强盗模型之间传递知识。 DCT利用用户和广告之间的相似性来估计汤普森采样的先前分布。这种相似性是根据用户和广告的上下文功能获得的。相似性使模型在没有太多数据的域中通过传输知识来更快地收敛。此外，DCT结合了用户的时间动态，以跟踪用户最近的偏好变化。我们首先显示传递知识并结合时间动力学改善了合成数据集上基线模型的性能。然后，我们对现实世界数据集进行了经验分析，结果表明，与最先进的模型相比，DCTS的点击率提高了9.7％。我们还分析了调整时间动力学和相似性的超参数，并显示最大化CTR的最佳参数。

translated by 谷歌翻译

Goal-Aware RSS for Complex Scenarios via Program Logic

Ichiro Hasuo , Clovis Eberhart , James Haydon , Jérémy Dubut , Rose Bohrer , Tsutomu Kobayashi , Sasinee Pruekprasert , Xiao-Yi Zhang , Erik André Pallas , Akihisa Yamada

分类：机器人

2022-07-06

我们引入了责任感敏感安全性（RSS）的目标延长，这是一种基于规则的自动驾驶系统安全保证（ADS）的方法。制定RSS规则保证目标实现 - 除了原始RSS中的避免碰撞外，还需要进行长时间的操纵序列的复杂计划。为了应对复杂性，我们基于程序逻辑引入了一个构图推理框架，其中可以系统地为较小的子赛车制定RSS规则，并将它们组合起来以获取用于较大场景的RSS规则。作为框架的基础，我们介绍了一个程序逻辑DFHL，可满足连续的动态和安全条件。我们的框架介绍了基于DFHL的工作流程，用于导出目标感知RSS规则；我们也讨论其软件支持。我们在安全体系结构中使用RSS规则进行了实验评估。它的结果表明，目标感知RSS确实有效地实现了避免碰撞和目标实现目标。

translated by 谷歌翻译

The CORSMAL benchmark for the prediction of the properties of containers

Alessio Xompero , Santiago Donaher , Vladimir Iashin , Francesca Palermo , Gökhan Solak , Claudio Coppola , Reina Ishikawa , Yuichi Nagao , Ryo Hachiuma , Qi Liu

分类：计算机视觉

2021-07-27

声学和视觉感测可以在人操纵时支持容器重量和其内容量的非接触式估计。但是，Opaquent和透明度（包括容器和内容的透明度）以及材料，形状和尺寸的可变性都会使这个问题具有挑战性。在本文中，我们向基准方法提出了一个开放框架，用于估计容器的容量，以及其内容的类型，质量和量。该框架包括数据集，明确定义的任务和性能测量，基线和最先进的方法，以及对这些方法的深入比较分析。使用单独的音频或音频和视觉数据的组合使用具有音频的神经网络的深度学习，用于分类内容的类型和数量，无论是独立的还是共同。具有视觉数据的回归和几何方法是优选的，以确定容器的容量。结果表明，使用仅使用Audio作为输入模块的方法对内容类型和级别进行分类，可分别获得加权平均F1-得分高达81％和97％。估计仅具有视觉视觉的近似接近和填充质量的容器容量，具有视听，多级算法达到65％的加权平均容量和质量分数。

translated by 谷歌翻译

Reproducing kernel Hilbert C*-module and kernel mean embeddings

Yuka Hashimoto , Isao Ishikawa , Masahiro Ikeda , Fuyuta Komura , Takeshi Katsura , Yoshinobu Kawahara

分类： (统计)机器学习 | 机器学习

2021-01-27

内核方法是机器学习中最流行的技术之一，使用再现内核希尔伯特空间（RKHS）的属性来解决学习任务。在本文中，我们提出了一种新的数据分析框架，与再现内核Hilbert $ C ^ * $ - 模块（rkhm）和rkhm中的内核嵌入（kme）。由于RKHM包含比RKHS或VVRKHS）的更丰富的信息，因此使用RKHM的分析使我们能够捕获和提取诸如功能数据的结构属性。我们向RKHM展示了rkhm理论的分支，以适用于数据分析，包括代表性定理，以及所提出的KME的注射性和普遍性。我们还显示RKHM概括RKHS和VVRKHS。然后，我们提供采用RKHM和提议的KME对数据分析的具体程序。

translated by 谷歌翻译